AI资讯新闻榜单内容搜索-Scaling La

Meta-Think ≠ 记套路，多智能体强化学习解锁大模型元思考泛化

最近，关于大模型推理的测试时间扩展（Test time scaling law ）的探索不断涌现出新的范式，包括① 结构化搜索结（如 MCTS），② 过程奖励模型（Process Reward Model ）+ PPO，③ 可验证奖励（Verifiable Reward）+ GRPO（DeepSeek R1）。

来自主题: AI技术研报

8582 点击 2025-07-04 09:44

NVIDIA Tensor Core 的演变：从 Volta 到 Blackwell

在我们去年 AI Scaling Laws article from late last year中，我们探讨了多层 AI 扩展定律如何持续推动 AI 行业向前发展，使得模型能力的增长速度超过了摩尔定律，并且单位 token 成本也相应地迅速降低。

来自主题: AI技术研报

8572 点击 2025-06-24 11:09

Scaling Law首次在自动驾驶赛道被验证！小鹏汽车CVPR演讲详解：AI「吃」下6亿秒视频后，智能涌现

CVPR 2025，自动驾驶传来重大进展： Scaling Law，首次在这条赛道被验证！

来自主题: AI资讯

7716 点击 2025-06-17 10:35

CVPR史上首次！中国车厂主讲AI大模型，自动驾驶也玩Scaling Law?

不去今年的CVPR不知道，原来中国自动驾驶在AI领域的创新已经这么牛了。作为今年唯一受邀参与CVPR演讲的车企，这家公司在AI顶流圈层上桌吃饭了！

来自主题: AI资讯

9792 点击 2025-06-16 16:52

阿里通义发布并行计算新策略：1.6B等效4.4B，内存消耗骤降95%

既能提升模型能力，又不显著增加内存和时间成本，LLM第三种Scaling Law被提出了。

来自主题: AI技术研报

8394 点击 2025-05-28 14:21

她如何把“系统2”带给了大模型｜对话微软亚洲研究院张丽

2023年，业界还在卷Scaling Law，不断突破参数规模和数据规模时，微软亚洲研究院张丽团队就选择了另一条路径。

来自主题: AI技术研报

6812 点击 2025-05-26 14:35

AI大厦需要新的地基！

「Scaling Law 即将撞墙。」这一论断的一大主要依据是高质量数据不够用了

来自主题: AI资讯

8131 点击 2025-05-19 14:03

只有通过海量测试才能抓住泛化性的本质吗？

当以端到端黑盒训练为代表的深度学习深陷低效 Scaling Law 而无法自拔时，我们是否可以回到起点重看模型表征本身——究竟什么才是一个人工智能模型的「表征质量」或者「泛化性」？我们真的只有通过海量的测试数据才能抓住泛化性的本质吗？或者说，能否在数学上找到一个定理，直接从表征逻辑复杂度本身就给出一个对模型泛化性的先验的判断呢？

来自主题: AI技术研报

9214 点击 2025-05-11 14:35

机器人的「物理图灵测试」，英伟达Jim Fan 17分钟演讲揭秘具身Scaling Law

Jim Fan，英伟达机器人部门主管和杰出科学家、GEAR 实验室联合领导人、OpenAI 的首位实习生，最近在红杉资本主办的 AI Ascent 上做了一场 17 分钟的演讲

来自主题: AI技术研报

8508 点击 2025-05-10 15:59

北大、清华、UvA、CMU等联合发布：大模型逻辑推理能力最新综述

当前大模型研究正逐步从依赖扩展定律（Scaling Law）的预训练，转向聚焦推理能力的后训练。鉴于符号逻辑推理的有效性与普遍性，提升大模型的逻辑推理能力成为解决幻觉问题的关键途径。

来自主题: AI技术研报

8251 点击 2025-05-08 10:50

AI资讯新闻榜单内容搜索-Scaling La

Meta-Think ≠ 记套路，多智能体强化学习解锁大模型元思考泛化

NVIDIA Tensor Core 的演变：从 Volta 到 Blackwell

Scaling Law首次在自动驾驶赛道被验证！小鹏汽车CVPR演讲详解：AI「吃」下6亿秒视频后，智能涌现

CVPR史上首次！中国车厂主讲AI大模型，自动驾驶也玩Scaling Law?

阿里通义发布并行计算新策略：1.6B等效4.4B，内存消耗骤降95%

她如何把“系统2”带给了大模型 ｜对话微软亚洲研究院张丽

AI大厦需要新的地基！

只有通过海量测试才能抓住泛化性的本质吗？

机器人的「物理图灵测试」，英伟达Jim Fan 17分钟演讲揭秘具身Scaling Law

北大、清华、UvA、CMU等联合发布：大模型逻辑推理能力最新综述

她如何把“系统2”带给了大模型｜对话微软亚洲研究院张丽